Národní úložiště šedé literatury Nalezeno 24 záznamů.  1 - 10dalšíkonec  přejít na záznam: Hledání trvalo 0.01 vteřin. 
Inteligentní extrakce dat ve webovém prohlížeči
Maštera, František ; Bartík, Vladimír (oponent) ; Burget, Radek (vedoucí práce)
Cílem této práce je získání dat z webových stránek bez znalosti jejich vnitřní struktury. Podstatou je rozpoznání této struktury pomocí algoritmu a zadaným vstupním informacím o obsahu, který chce uživatel extrahovat. Po analýze struktury následuje extrakce samotného obsahu. Na vybraných sadách internetových stránek se podařilo dosáhnout průměrné úspěšnosti přes 80%. Výsledný algoritmus představuje nový přístup k extrakci dat a může být nasazen v reálném světě, nebo může být součástí dalšího vývoje.
Rozšíření Apache Tika o extrakci textu ze souborů průmyslových formátů
Rešetár, René ; Burget, Radek (oponent) ; Rychlý, Marek (vedoucí práce)
Cieľom bakalárskej práce bolo rozšíriť syntaktické analyzátory projektu Apache Tika o extrakciu tabuliek a dát z priemyslových formátov dokumentov z laboratórnych prístrojov. Tieto dáta majú byť uložené v štruktúrovanom formáte podľa určitej schémy. V teoretickej časti boli preskúmané dodané industriálne formáty, projekt Apache Tika a možnosti jeho rozšírenia. V praktickej časti bol navrhnutý a implementovaný nástroj, ktorý dokumenty pomocou projektu Apache Tika klasifikuje, spracuje, vytvára z nich štruktúrované dáta vo formáte JSON a tie následne validuje. Na záver bola vytvorená sada testov pre overenie a demonštráciu vlastností riešenia.
Vyhledávání objektů v obraze na základě předlohy
Novák, Pavel ; Mašek, Jan (oponent) ; Burget, Radim (vedoucí práce)
Tato práce se zabývá detekcí objektů v obraze na základě předlohy. Hlavním přínosem práce je nová metoda extrakce příznaků histogramu orientovaných gradientů používající sadu komparátorů pro extrakci dat. V práci jsou popsány použité metody komparace a extrakce. Hlavní část je věnována především metodě histogramu orientovaných gradientů, ze které vycházíme. V práci je užita malá sada trénovacích obrazů (celkem 100) ověřená křížovou validací, následně ověřená na reálných scénách. Dosažená úspěšnost křížové validace je až 98% pro SVM algoritmus.
Analýza postojů v oblasti automobilového průmyslu
Bezák, Adam ; Otrusina, Lubomír (oponent) ; Smrž, Pavel (vedoucí práce)
Cieľom tejto práce je oboznámiť sa so základnými metódami analýzy postojov na sociálnych sieťach.  Téma práce je zameraná na automobilový priemysel, avšak princíp práce je možné použiť na akékoľvek iné skúmané odvetie. Podstatou praktickej časti je získanie dát zo sociálnych sietí, ich analýza a následná indexácia do ElasticSearch databáze. Ďaľším cieľom práce je tieto dáta vizualizovať prostredníctvom portálu. Vytvorený webový portál poskytuje rôzne štatistiky popredných automobilových značiek, prehľad nových trendov alebo vizualizáciu názorov na konkrétne aspekty jednotlivých automobilov.
Vztah změn sázkových kurzů a výsledků fotbalových zápasů
Jurkovič, Juraj ; Bartík, Vladimír (oponent) ; Zendulka, Jaroslav (vedoucí práce)
Cieľom tejto práce je demonštrovať techniky pre riešenie úloh extrakcie dát z webu a získavania znalostí z dát. Prípadová štúdia je zameraná na zber dát zo stávkových kancelárií a následnú analýzu týchto dát. Práca demonštruje riešenie úlohy získavania dát z webu v jazyku Python. Práca popisuje vybrané implementačné detaily pre vytvorenie systému na zber dát z webu a navrhuje schému databázy, ktorá môže byť v tomto systéme použitá. Získané dáta sú analyzované štatistickými metódami a vo vývojoch cien kurzov sú objavované frekventované vzory pomocou apriori algoritmu. Pozorované vzťahy a objavené frekventované vzory sú prezentované koncovému užívateľovi.
Methods of Data Extraction from the Web
Perina, Lukáš ; Křivka, Zbyněk (oponent) ; Burget, Radek (vedoucí práce)
The purpose of this bachelor thesis is to design an architecture and subsequent implementation of an application designed for data extraction (web scraping) from web documents. Unlike conventional methods, it is an extraction based on defining data types and regular expressions of requested elements. Extraction is executed in such a manner, where it is not necessary to know the detailed structure of given web document and the possibility of using just one definition to detect requested elements on different web pages. Algorithm is able to achieve overall accuracy of 85,51% and recall 80,28%. This approach can reduce the time required for analysis of web pages significantly and not to take the structure of the code as a determining factor while creating web scraping requests.
Prostředí pro analýzu podezřelého zařízení
Procházka, Jan ; Martinásek, Zdeněk (oponent) ; Malina, Lukáš (vedoucí práce)
Bakalářská práce se zabývá návrhem prostředí pro analýzu podezřelého zařízení. Tímto zařízením může být například škodlivým kódem kontaminovaný disk nebo mobilní zařízení. Cílem práce je navrhnout efektivní a jednoduché prostředí s použitím open source produktů. Finální prostředí by mělo být schopné provádět jak povrchovou, tak i hloubkovou analýzu dat. Teoretická část poskytuje informace spojené s problematikou práce a obsahuje pojmy jako jsou Sandbox, Malware, Android. Ty jsou popsány z pohledu důležitého pro pochopení analýzy malwaru vyskytujícího se převážně na mobilním zařízení. Praktická část popisuje použitý hardware a software pro návrh prostředí a obsahuje názorné ukázky analýz škodlivým kódem kontaminovaných externích zařízení. Jedná se převážně o mobilních zařízení se systémem Android.
Portál pro agregaci dat z webových zdrojů
Mikita, Tibor ; Křivka, Zbyněk (oponent) ; Burget, Radek (vedoucí práce)
Táto práca sa zaoberá extrakciou a následnou agregáciou dát z heterogénnych webových zdrojov. Cieľom je vytvorenie portálu, funkčnej webovej aplikácie, využívajúcej vhodné technológie. Hlavné zameranie práce je na architektúru a samotnú implementáciu aplikácie. Za aplikačnú doménu bolo zvolené ubytovanie, resp. hľadanie prenájmu. Pre extrakciu dát sa využíva API portálu alebo wrapper. Získané dáta sa ukladajú do dokumentovej databázy. V tejto práci sa podarilo navrhnúť a implementovať systém, pomocou ktorého je možné získavať inzeráty s prenájmami bytov z viacerých webových zdrojov zároveň a tie jednotnou formou prezentovať používateľovi na jednom mieste.
Extrakcia informácií z formulárov
Pálinkás, Adam
Tato práce se zabývá návrhem a implementací aplikace, která využívá pokročilé techniky rozpoznávání textu a techniky zpracování obrazu na zpracování ručně vyplněných údajů z naskenovaných formulářů. V rámci práce jsou analyzované existující metody a technologie pro rozpoznávání textu a vybrané z nich jsou implementovány do výsledné aplikace, která zefektivňuje zpracování formulářů ve společnosti CYRRUS, a. s.
Extrakce dat z dokumentů na základě analýzy rozložení
Sedláček, Martin ; Bartík, Vladimír (oponent) ; Burget, Radek (vedoucí práce)
Diplomová práce se zabývá automatizovanou extrakcí dat z lékařských zpráv ve formátu PDF na základě analýzy rozložení dokumentu. Hlavním obsahem práce je uvedení čtenáře do problematiky extrakce dat, srovnávaní existujících nástrojů a představení návrhu a požadavků vyvíjeného nástroje, který bude založen nad aplikačním rámcem FitLayout. Práce dále popisuje samotnou implementaci nástroje v jazyce Java a komentuje výsledky, kterých nástroj dosáhl na reálných datech.

Národní úložiště šedé literatury : Nalezeno 24 záznamů.   1 - 10dalšíkonec  přejít na záznam:
Chcete být upozorněni, pokud se objeví nové záznamy odpovídající tomuto dotazu?
Přihlásit se k odběru RSS.